トド 理 


ひと 言 で 「 マ ル チ プ ロ セ ッ サ ]」 と 言っ て も , ハー ドウ ェ ア や ソフ 
トウ ェ ア の 構成 な ど に よっ て 実現 で きる 機能 が 異な る . また , 
マル チ プ ロ セ ッ サ 構成 を 採用 する と 性 能 の 向上 や 消費 電力 の 低 
減 に 効果 が ある が , その 一 方 で , 開発 環境 な どの 整備 の 点 で 課 
題 が 残っ て いる . ここ で は , こう し た マル チ プ ロ セ ッ サ の 基本 
的 な 構成 や 利用 の メリ ッ ト , 今後 の 課題 に つい て , と くに 組み 
込み 機器 分 野 で の 利用 を 意識 し て 解説 する . (編集 部 ) 


近年 , ゲー ム 機 や パソ コン な ど , 高い 性 能 が 要求 され る 
民生 機器 の 分 野 に お いて ,「 マル チ プ ロ セ ッ サ 」 半 マル チ 
コア 1 チッ プ 上 に 集積 し た マル チ プ ロ セ ッ サ ・ シ ステ ム )」 


「 単 機能 の 性 能 対 消費 
CPU ゲ ] 電力 比 に お いて 有利 ! | 図 


1 中 理 の ソフ エ 
MPEG-4 専 用 鐘 電 還 は 株 較 
ハー ドウ ェ ア 団 CPU 

LT DSP 


多 機能 化 に 有利 図 
ハー ド ウェア を 共有 図 


性 能 / 消 費 電力 


CPU 
高級 言語 に よっ て 


プロ グラ ミン グ が 凶 
容易 に 較 


汎用 性 
図 1 プロ セッ サ の メリ ッ ト , デメ リッ ト 
例え ば , アプ リケーション と し て MPEG-4 CODEC を 高速 CPU で すべ て 処 
理 し た 場合 , DSP を 使っ て 処理 し た 場合 , MPEG-4 専 用 ハー ド ウェ ア を 用 
いて 処理 し た 場合 を 考え る . 一 般 に , MPEG-4 の よう な 信号 処理 アプ リ ケ ー 
ショ ン で は , 汎用 の CPU より も 積 和 演 算 器 を 備え た DSP を 使っ た ほう が 同 
じ 処 理 を 少な い 消 費 電力 で 実行 で きる . また , MPEG-4 専 用 の ハー ドウ ェ ア 
を 作る と , 消費 電力 は さら に 少な く な る . これ に 対し て , MPEG-4 以 外 の ア 
プリ ケー ショ ン へ の 適用 を 考え る と , 専用 ハー ドウ ェ ア は も っ と も 汎用 性 が 
小さ く , CPU が も っ と も 大 きく なる. つま り , 汎用 性 と 単体 アプ リ ケ ー シ 
ョ ン の 性 能 対 消費 電力 比 は トレ ー ド オフ の 関係 に な る . し た が っ て , 汎用 性 
を 重視 する パソ コン で は 高速 CPU が 向い て いる が , 機能 の 限定 され た 組み 
込み 機器 で は 性 能 が 必要 な 部 分 を 専用 ハー ドウ ェ ア や DSP で 処理 させ , 残 
り を 小さ な CPU で 行う と いう よう な マル チ プ ロ セ ッ サ 形態 が 有利 に な る . 
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包 及 「 マル チ プ ロ セ ッ サ 」 と は 


ーー 多 機能 ・ 低 消費 電力 の 要求 に 
こたえ る た め の 技 術 的 要素 と 課題 


吉田 正康 


と いう こと ば を 耳 に する こと が 増え まし た . 携帯 電話 や カ 
ー・ ナビゲーション ・ シ ステ ム な ど で も さら な る 高 性 能 化 
が 求め られ て お り , マル チ プ ロ セ ッ サ に 対す る 期待 が 高 ま 
っ て き て いま す . ここ で は , まず マル チ プ ロ セ ッ サ の 概要 
を 解説 し ます . 次 に , マル チ プ ロ セ ッ サ を 組み 込み 機器 分 
野 で 適用 する 際 の 課題 と 展望 を 説明 し ます . 


般 に 白 物 家電 や AV 機器 な どの 組み 込み 機器 分 野 で は 
あら か じ め 決 め ら れ た こと を 決め られ た 手順 で , か っ 最小 
限 の コス ト で 実現 する こと が 求め られ て いま す . この た め , 
これ まで 信号 処理 は お も に 専用 の ハー ド ・ ワ イヤ ー ド 論理 
で 実現 され て きま し た . し か し , 携帯 電話 や カー・ ナ ビ ゲ 
ーション ・ シ ステ ム な どの 一 部 の 組み 込み 機器 で は , 機能 
の 複合 化 に 伴っ て シス テム が 複雑 か つ 大 規模 に な っ て お り , 
機能 の 組み 合わ せ を いか に 効率 良く 実現 する か が 問題 に 
っ て き て いま す . また , と くに 携帯 電話 な ど で は , 二 
急激 な 立ち 上 が り に 対応 する た め , 非常 に 短い 期間 で の 開 
発 が 求め られ て いま す . 

これ ら の 問題 に 対す る 解 と し て , 近年 , DSR ディ ジ タ 
ル 信 号 処理 プロ セッ サ ) や CPU な ど , ソフ トウ ェ ア の プロ 
グラ ミン グ に よっ て 実現 する 論理 機能 を 利用 する 方 法 が 重 
要 視 さ れ て き て いま す . 本 稿 で は , こう し た 方 法 を 「 プロ 
セッ サ 」 と 定義 し た いと 思い ます . 


@ プロ セッ サ を 用 いた シス テム 設計 の 一 長 一 短 

プロ セッ サ は ハー ド ・ ワ イヤ ー ド 論理 と 比べ て , 以下 の 
よう な メリ ッ ト が あり まず 図 1). 

さま ざま な 機能 に 対し て ソフ ト ウェ ア を 再 利用 する こと 


に よっ て , シス テム 全体 の ハー ド ウェ ア 規 模 を 低減 で き 

る と くに 大 規模 シス テム に お いて 再 利用 率 が 高く な る ) 

回 路 設計 後に 発見 され た 不 ぐ あい を ソフ ト ウェア で 回 
人 避 ・ 修正 で きる 

e* シス テム 設計 後に , 機能 の 追加 や 個人 の 要望 に 合わ せ た 
カス タマ イズ が 行え る 

し か し , その 反面 , 以下 の よう な デメ リッ ト が あり ます . 

e 回 路 が 冗長 に な り , 単 一 機能 た お いて は 性 能 や 消費 電力 
の 面 で か な ら ず し も 最適 値 で は な い 

e 開発 に あたっ て , ハー ドウ ェ ア と ソフ ト ウェ ア の 両面 を 
設計 する 必要 が あり , 開発 の 複雑 度 が 増す 
すなわち , プロ セッ サ を 用 いて シス テム 設計 を 行う 場合 

は , 次 の 2 点 に 注意 する こと が 重要 で す . 

1) 性 能 や 消費 電力 な ど を 事前 に 検証 する こと で , 必要 十 
分 な マー ジン を 明確 に し て お く 

2) ハー ド ウェ ア と ソフ ト ウェ ア の 両面 を 開発 , デバ ッ グ 
で きる ツー ル 群 を あら か じ め 準 備 し て お く 


人 @ 組み 込み 向け マル チ プ ロ セ ッ サ は ヘテロ で 非対称 な 構成 

近年 , 組み 込み 機器 向け プロ セッ サ の 分 野 で も , マル チ 
プロ セッ サ が 脚光 を 浴び て いま す . 

そもそも 製品 と し て の 組み 込み シス テム は , 単 一 の 処理 
で は な く , さま ざま な 処理 が 分 散 ・ 協 調 し な が ら 実 行 さ れ 
る も の が ほとん ど で す . 例え ば 携帯 電話 端末 に は , 通信 機 
能 や ゲー ム , ユー ザ ・ イ ンタ ー フ ェ ー ス と いっ た アプ リ ケ ー 
ショ ン 機 能 が 搭載 され て お り , これ ら の 機能 は 複数 の プロ 
セッ が CPU や DSP) で 実現 され て いま す . つま り , この よ 
うな 機能 を 一 つの 装置 と し て 実現 し て いる シス テム は , 必 
然 的 に マル チ プ ロ セ ッ サ 構成 を と る こと に な り ま す . 


計時 還 組み 込み 分 野 の 
回国 画 | マル チコ ア 」 

と ころ で , 上 記 ず の マル チ プ ロ セ ッ サ 」 と 最近 パソ コン や 
ゲー ム 機 で 使わ れ て いる コン ピュ ー タ と し て の マル チ プ ロ 
セッ サ 」 で は , 少し 論点 が 異な る よう に 感じ ます . この 点 に 
つい て , 以下 の 三 つ の 視点 で 整理 し た いと 思い まず 図 2). 
1) 機能 分 散 と 負荷 分 散 

マル チ プ ロ セ ッ サ を 採用 し た シス テム を 考え る と き , そ 
れ ぞ れ の プロ セッ サ が 別々 の 機能 を 持ち も , それ ら の 処理 が 
協調 する こと に よっ て シス テム を 構築 する と いう 考え か た 
が あり ます . これ を |「 機能 分 散 」 と 言い ます . これ に 対し 
て , 単 一 の 処理 を 複数 の プロ セッ サ で 分 担 す る こと に より , 
ひと つ ひ と つの プロ セッ サ の 処理 負荷 を 減ら すこ と が で き 
ます . この よう な 考え か た を |「 負荷 分 散 」 と 言い ます . 

この 二 つ は , シス テム 設計 に お いて 意識 すべ き 着 眼 点 と 
いえ ます . 

2) へ ヘテロ ジニ アス と ホモ ジニ アス 

へ テロ ジニ アス と ホモ ジニ アス と いう こと ば は , 一 般 に 
マル チ プ ロ セ ッ サ の ハー ド ウェ ア 構 成 を 説明 する と き に 用 
いら れ ま す . へ テロ ジニ アス は , プロ セッ サ が 異質 な 」 結 
合 を し て いる シス テム で す . 例え ば , CPU と DSP と いっ 
た まっ た く 異な る プロ セッ サ を 結合 し て いる ケー ス や , 
CPU どう し で あっ て も 異な る アー キテ クチ ャ の も の を 結合 
し て いる ケー ス を 指し ます . 

一 方 , ホモ ジニ アス ば 等 質 」 な 結合 を し て いる シス テム 
を 指し ます . この シス テム で は , 同一 の アー キテ クチ ャ や 


分 類 法 較 機能 分 散 較 負荷 分 散 較 


ハー ドウ ェ ア 均質 性 鐘 | ヘテロ ジニ アズ 不 均質 ) 図 ホモ ジニ アズ 均質 ) 
ソフ トウ ェ ア 対 称 性 凶 | 非対称 AMP) 凶 


対 和 SMP) 図 
結合 距離 / レ イ テ ン シ 図 | 疎 結 毅 遠い ) 図 密 結 前 近い ) 図 
並列 化 粒度 較 粗 粒度 図 細 粒 度 凶 


( a) 分 類 較 


アプ リ ケ ー 因 ヲリ の 呈 層 
ショ ン A 2 ヨン 


スレ ッ ド B 


SMP 対 応 OS 
CPU A CPU B 


| 上 


( b) 機能 分 散 型 ヘテロ ジニ アス , 非対称 ) 較 
図 2 マル チ プ ロ セ ッ サ の 分 類 


組み 込み 分 野 で は , 自然 発生 的 に 機能 分 散 型 構成 へ テロ ジニ アス , 非対称 ) が 発 


称 ) が 発展 し て いる . 


( c) 負荷 分 散 型 ホモ ジニ アス , 対称 ) 凶 


展 し て いる . 一 方 , コン ピュ ー タ の 分 野 で は 負荷 分 散 型 構 成 ホモ キジ ニア ス , 対 
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構成 の プロ セッ サ を 複数 結合 
3) 非 対 稼 AMP) と 対 稼 SMP) 


し て いま す . 


非対称 か 対称 か は , ソフ トウ ェ ア が それ ぞ れ の プロ セッ 
サ を どう 扱う か を 説明 する 視点 で す . 

非対称 マル チ プ ロ セ ッ ザ AMP) では, それ ぞ れ の プロ 
セッ サ の 上 で OS に 代表 され る 別々 の ソフ ト ウェ ア 基 盤 が 
動作 し ます . し た が っ て , 各 プ ロ セ ッ サ の ソフ トウ ェ ア 基 
盤 の 上 で 動く 上 位 ソ フト ウェ ア が , それ ぞ れ の 処理 結果 を 
個別 に 調停 し つつ , ほか の プロ セッ サ の ソフ ト ウェ ア 基 盤 
と 協調 動作 する 必要 が あり ます 

対称 マル チ プ ロ セ ッ ボ SMP) では, 各 プ ロ セ ッ サ 間 の 処 
理 の 調停 を 単 一 の ソソ フト ウェ ア 基 盤 が 行い ます . し た が っ 
て , アプ リケーション な どの 上 位 ソ フト ウェ ア か ら 見 た と 
HH 

先ほど 例 を 挙げ た 携帯 電話 に お ける 通信 プロ セッ サ と ア 
ブリ ケー ショ ン ・ プロ セッ サ な どの よう な マル チ ギブ プロ ヤッ 
サ 構 成 は , も と も と 別々 の 機能 処理 専有 の ハー ド ・ ワ イ 
ヤー ド 論理 で 行っ て いた も の ) を プロ セッ サ 処 理 に 置き 換 
える こと で 自然 発生 し まし た . この よう な 機能 分 散 型 の マ 
ル チ プ ロ セ ッ サ で は , 必然 的 に ヘテロ ジニ アス な 非対称 f 
成 を と り ま す . 

し か し , コン ピュ ー タ に お ける マル チ プ ロ セ ッ サ は , 主 と 

高 性 能 と 低 消費 電力 の 実現 の 要求 に 基づき , 負荷 分 散 

を 行う こと に 主眼 を 置い て いま す . この た め , ホモ ジニ ア 


ス で 対称 な 構成 を 目 ど し た アー キテ クチ ャ と な っ て いま す . 


人 @ 複数 の プロ セッ サ で 性 能 が 向上 し , 消費 電力 が 下がる 
マル チ プ ロ セ ッ サ に よる 性 能 向 上 の 要因 と し て は , 以下 
の も の が 挙げ ら れ ま す . 
e 処理 の スル ー プ ッ ト 向上 
e レ スポ ンス の 向上 
処理 の スル ー プ ッ ト 向上 と は , 複数 プロ セッ サ の 同時 動 
作 に よる ピー ク 性 能 の 向上 を 指し て いま す . 
レス ポン ス の 向上 と は , マル チタ スク 環境 下 で 動作 し て 
いる シス テム に お いて , タス ク 応 倫 待 機 し て いる プロ セッ 
サ が 増え る こと に より , ほか の タス ク の 終了 を 待つ 可能 性 
が 低下 する こと で ポ 図 3). 
また , マル チ プ ロ セ ッ サ 構成 を と る と 低 消費 電力 化 を 図 
る こと が で きま す . さて , これ は な ぜ で し ょ うか . 
これ まで , プロ セッ サ の 高 性 能 化 は 主として 周波 数 の 向 
に よっ て 実現 され て いま し た . プロ セッ サ の 設計 者 は 
の た め に 以下 の よう な 改善 を 行っ て きま し た . 
e ト ラン ジス タ の 微細 化 に よる 負荷 容量 の 低減 と トグル 周 
波数 トラ ンジ スタ の スイ ッ チ ング 速度 ) の 向上 
e 論理 ゲー ト の ファ ン ア ウト 数 の 低減 と ゲー ト 遅延 の 圧縮 
e プロ セッ サ 演 算 器 の パイ プラ イン 化 に よる スル ー プ ッ ト 
の 改善 
この 中 で , と く 同 トラ ンジ スタ の 微細 化 」 と 「 トグル 周 


処理 時 間 経過 図 オー バ ヘ ッ ド 図 


グ 


ルス ポン ス 時 間 図 


に 


so 中 wm TTF ss 


タス ク ・ ス ケ ジ ュ ー リ 
ング ( タス ク の 並べ 替 
え ) お よび コン テク ス 
スイ ッ プ ( 実行 タ 
ィ スク の 切り 替え ) に か 


b1 1 か る 時 間 図 


- バ デー タ に 依存 図 


T 4 


図 3 
マル チ プ ロ セ ッ サ に よる レス ポン ス の 改善 


シン グル ・ コ ア の 場合 と 比べ て , マル チコ ア で 
は 次 の スレ ッ ド に 対す る レス ポン ス 時 間 を 短縮 


タス ク 間 の 同期 に 必要 
な 待ち 合わ せ と プ ロ セ 


--- 人 信 プロ セス C と 先行 関係 に あ 
』 ッ サ 間 の スイ ッ チ 図 


る プロ セス A, B を 並列 実行 す 
る こと に よっ て , C の 完了 が 早 
く な る ( AーC, B-ーC の 順番 の 
と き , A と B を 並列 化 ) 図 並列 オー バ ヘ ッ ド 図 
e 通信 凶 

e 負荷 不 均等 図 

e 逐次 部 分 凶 


で きる . 
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計時 回 組み 込み 分 野 の 
加古 「 マ ル チ コ ア 」 


波数 の 向上 」 を 両立 させ る た め に は , 相対 的 に 大 電流 が 流 し て いく と いう こと に な り ま す . 
れる よう に LSI を 製造 する か , も し く は 相対 的 に 高い 電圧 e 高 機能 OS に よる マル チタ スク 処理 の 普及 
で 駆動 する 必要 が あり ます . これ ら の 設計 は 消費 電力 を 大 と くに , 負荷 分 散 型 の マル チ プ ロ セ ッ サ に お いて , プロ 
きく する 方 向 に 働き ます . マル チ プ ロ セ ッ サ で は , 単 一 プ セッ サ が 実行 する タス ク や スレ ッ ド の 処理 を 割り 付け る OS 
ロ セ ッ サ と 同じ 性 能 を 実現 する た め に 低い 動作 周波 数 の プ の 存在 は 必須 で 下 掲 の コラ プロ セス , タス ク , スレ 
ロ セ ッ サ を 複数 用 いる こと で , 消費 電力 の 増加 に つなが る ッ ド 」 を 参照 ). 
製造 や 駆動 に 関す る 問題 を 回 避 し ます . 近年 , 組み 込み 機器 分 野 に お いて も , OS に よる 複数 の 
le タス ク 処 理 マル チタ スク ) の スケ ジュ ー リ ング は 一 般 的 に 
フ マル チ プ ロ セ ッ サ を 支え る 技術 な っ て いま す . 中 で も Linux や Windows と いっ た 高 機能 
ee な OS を 用 いれ ば 動 的 に タス ク を 配分 する こと が で き , 完 

従来 , 大 規模 コン ピュ ー テ ィング を 中 心 に 採用 され て い 全 な 対称 マル チ プ ロ セ ッ サ に 対応 し た 処理 が 期待 で きま す . 
た マル チ プ ロ セ ッ サ が , 組み 込み 機器 で も 使え る よう に な な お , 機能 分 散 型 マ ル チ プ ロ セ ッ サ で は , か な ら ず し も 
っ て きた 背景 に は , 以下 の よう な も の が 挙げ られ ます . OS の 機能 は 必須 で は あり ませ ん . 

e ト ラン ジス タ の 微細 化 に よる 機 肖 8 e ボトル ネッ ク を 防ぐ バス 技術 の 進化 

現在 , 組み 込み 機器 向け の 半導体 に は , 一 般 に 設計 ルー マル チ プ ロ セ ッ サ で は , プロ セッ サ 間 の 通信 , 共通 リ ソ 
ル が 生生 これ が , ー ス へ の アク セス に お いて , 複数 プロ セッ サ か ら の バス ・ 
2005 年 か ら 2007 年 に か け て 90nm に 移行 し て いき ます . さ アク セス 要求 が 競合 する 可能 性 が あり , 一 般 に 単 一 プロ セ 
ら に , その 先 を 見 越し て 65nm プロ セス の 開発 が 進ん で い ッ サ より も バス に 高い 性 能 が 要求 され まず ざ キャ ッシュ を 
ます . 130nm っ 90nm っ 65nm と トラ ンジ スタ の 微細 化 が 持っ た プロ セッ サ で は , 単 一 プロ セッ サ よ り も キャ ッシュ 
進む と , 同一 面積 上 に 搭載 で きる トラ ンジ スタ 数 は 約 21 の リ プレ イス を 低減 で きる と いう 考え か た も ある ). 
倍 , それ か ら さ ら に 約 19 倍 と 増え て いき ます *. 

つま り , 同等 機能 で 同等 の 価格 を 維持 する と いう 前 提 で 注 : トラ ンジ スタ の 微細 化 に よっ て , LSI の サイ ズ が か な ら ず 小さ く な る と 

は 言い 切れ な い . 実際 に は , LSI の 出力 端子 数 の 関係 で , LSI パ ッ ケ ー 
ば , 性 能 向上 に 使え る トラ ンジ スタ 数 は 飛躍 的 に 向上 ジ の サイ ズ が 変わ ちな い ケ ー ス が 多々 ある . 


器 Column | _ プロ セス , タタ スク, スレッド 


以下 の 用 語 は , 並列 処理 を 行う ソフ トウェア 開発 で 使わ れ ま す が , 同一 プロ セス 内 の スレ ッ ド は , アド レス 空間 メモリ, ファ イ 

混乱 され や すい こと ば で 図 A-1). ル 記 述 子 , UI アク セス 制御 ) を 共有 し ます . また , 個々 の スレ 
ッ ド は , プロ グラ ム ・ カウンタ, スタ ッ ク , レジ スタ を 保有 し て 

⑯ プロ セス いま す 

単体 で 実行 可能 な プロ グラ ム の 単位 で す . 複数 の プロ セス が 存在 す 
る と き は , それ ぞ れ 独立 し た アド レス 空間 を 持ち ます . プロ セス A プロ セス B 
⑯ タス ク 

OS の 処理 単位 を 表し ます . UNIX 系 の 表現 で は プロ セス と 同義 に 
扱わ れ て いま す . 一 つの OS 上 で 複数 の タス ク 処 理 を 行え る も の を , 
マル チタ スク と 呼び ます 。 

プロ セス や タス ク よ り 細か い プ ログ ラム の 単位 で す . スレ ッ ド ・ プ 
回 多き ジグ ュ = デル らし で 人 長 。 王 つの 所 2 に つの レツ RG 
持 ゴ シン グル ・ ス レッ ド 」 と , 複数 の スレ ッ ド で 構成 され る マル チ 0 NAM20005 


スレ ッ ド 」 が あり ます . 図 A-1 プロ セス と スレ ッ ド 
ー つ の プロ セス は , 一 つま た は それ 以上 の スレ ッ ド で 構成 され る . 
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バス の 性 能 に 対す る 要求 は ホモ ジニ アス か へ テロ ジニ 
アス か , 対称 か 非対称 か に よっ て 異な り ま す . 一 般 に , ホ 
モジ ニア ス な 対称 マル チ プ ロ セ ッ サ で は 高い バス 性 能 を 要 
求 さ れ ま す . 

現在 , さま ざま な 高速 バス が 提案 され て いま す が , 代表 
的 な 高 性 能 オ ンチ ッ プ ・ バ ス と し て , 英国 ARM 社 の AXI 
( Advanced eXtensible Interface) と , オー プン 規格 の 
OCR Open Core Protocol) が 挙げ ら れ ま す . 

e 開発 を 効率 化す る デバ ッ グ 技術 の 普及 

現在 の プロ セッ サ の 多く は, JTAG を ベー ス と し た デバ 
ッ グ ・ ポー ト を チッ プ 上 に 有 し て いま す 。 これ に よっ て , 
処理 の 実行 ・ 停止 と いっ た 制御 や 処理 内 容 の トレ ー ス 機能 
を 実現 で きま す . また , これ ら の デバ ッ グ ・ ポ ー ト を 利用 
し た さま ざま な 製品 デバ ッ ガ な ど ) が 販売 され て いま す . 
JTAG を 利用 する と , 複数 の デバ イス を 一 つの デバ ッ 
グ ・ ポ ー ト に シリ アル に 接続 で きま す . こう し た 特徴 を 利 
用 し て , マル チ プ ロ セ ッ サ 対応 の デバ ッ 友 マル チ プ ロ セ 
ッ サ で あっ て も 一 つの デバ ッ ガ に 接続 で きる ) を いく つか 
の ベン ダ が 開発 し て いま す . 


信 H.264 の デコ ー ド 処理 の 消費 電流 は 120mA 
上 述 の ハー ドウ ェ ア や ソフ ト ウェ ア の 技術 の 進歩 に 伴っ 
て , マル チ プ ロ セ ッ サ 構成 を 1 チッ プ に 集積 し た 組み 込み 


LSI 製品 が 市 場 に 出 始め まし た . 

例え ば , 図 4 は , 筆者 ら ( NPC エレ クト ロニ クス ) が 開 
発し た 携帯 電話 向け アプ リケーション ・ プ ロ セ ッ ザ MP211」 
で す . 本 プロ セッ サ に は 三 つ の CPU 200MHz 動作 の ARM 
926) と 一 つの DSP が 集積 され て お り , へ テロ ジニ アス な 
非対称 マル チ プ ロ セ ッ サ を 構成 し て いま す . 130nm の 
CMOS プロ セス で 製造 し て いま す . 6658 万 個 の トラ ンジ 
スタ を 895mmX 895mm の チッ プ に 集積 し て お り , 量産 
可能 な ダイ ・ サ イズ と な っ て いま す . 本 アプ リ ケー ショ 
ン ・ プロセッサ で は , H264 圧 縮 画 像 の 復号 化 処 理 を 200 
MHz で 動作 可能 な CPU と DSP を 用 いて 実現 し て いま す . 
消費 電力 は , 1.2V の 電源 電圧 で 120mW と きわ め て 低く な 
っ て いま す . 

また , ARM 社 は , 完全 な ホモ ジニ アス で , か つ 対 称 マル 
チ プ ロ セ ッ サ の アー キテ クチ ャ を 実現 し 刀 ARM11 MPcore」 
を 発表 し て いま ず 図 5). さら に 効率 的 な マル チ プ ロ セ ッ 
サ が 組み 込み 機器 の 分 野 で 使わ れ よ うと し て いま す . 


以上 , 組み 込み 機器 の 分 野 に お ける マル チ プ ロ セ ッ サ に 
つい て 簡単 に 説明 し まし た が , と くに ホモ ジニ アス な 対称 


ケー ショ ン を 実行 . 例え ば 
通話 処理 や ブラ ウザ な ど 図 


3 
, | 図 
遇 胃 ン を 実行 


アプ リケーション を 実行 較 


MPEG ス トリ ー ム 処理 , 音声 MPEG-4 CODEC や H.264 較 
0 処理 な ど , 中 断 が 許さ れ な い デコ ー ド な ど , 画像 の 伸張 ・ 


圧縮 処理 を 実行 較 


ARM926 ARM926 


図 は と Sc は マー 山 ・ さ マター ニ テツ 


コン テン ツ を 保存 する 場合 , 例 


メモ リ な どの 記憶 素子 に 較 
暗号 化 な ど を 行う 回 路 較 


MP211 
図 4 マル チ プ ロ セ ッ サ の 例 その 1) 


ARM926 


隊 こ 図 
イン ター フェ ー ス 凶 


メモ リー ステ ィ ッ ク 縛 
ュー 
AU ジン 
DDR 凶  [ 
ン 全 2 バー ショージ 4 


SRAM 図 
640K バ イト 凶 
最大 HVGA 
5 LCD (320X480 
折 ピク セル 


マル チ プ ロ セ ッ サ を 搭載 し た NEC エレ クト ロニ クス の 携帯 電話 向け アプ リケーション ・ プ ロ セ ッ ザ ガ MP211」 の 内 部 ブロ ッ ク 図 を 示す . 各 プ ロ セ ッ サ に 最適 な 処 


理 を 割り 当て て , 高 性 能 ・ 高 効率 を 実現 し た . 
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マル チ プ ロ セ ッ サ 技術 は まだ 導入 初期 で あり , 実際 の 適用 
に あたっ て いく つか の 課題 が あり ます . 以下 に , お も な 課 
題 と その 対策 に つい て 簡単 に 説明 し た いと 思い ます . 


⑯ シン グル ・ タ スク の 性 能 実 現に 向け た 投 和 実 行 


対称 マル チ プ ロ セ ッ サ は , マル チア プリ ケー ショ ン , マ 
ル チ タ スク の 処理 の 加速 に 適し た アー キテ クチ ャ で す が , 
組み 込み 機器 に お いて は , か な ら ず し も つね に マル チタ ス 


ク に な る と は 限り ませ ん . この 場合 , タス ク を より 小さ な 
単位 で ある スレ ッ ド に 分 割 し て 並列 動作 させ る こと が 可能 
で す . し か し , 組み 込み 機器 に お いて は スレ ッ ド ・ プ ログ 
ラミ ング が 適用 され て いな いも の が あり , 注意 が 必要 で す . 

な お , 本 件 に 関す る 新しい 動き と し て , 並列 実行 が 可能 
な スレ ッ ド を コン パイ ラ が 自動 抽出 し て プロ セッ サ が 投機 
的 に 実行 し て いく , と いう 考え か た が あり ます . 図 6 に 筆 
者 ら の 研究 内 容 を 簡単 に 説明 し ます . これ に より , マル チ 
プロ セッ サ の 負荷 分 散 の 効率 を 最大 限 に 発揮 する こと が で 
きま す . 


信 シス テム 性 能 の 最適 化 の た め 負 荷 の バラ ンス を 考え て 
分 割 さ れ た タス ク や スレ ッ ド の 負荷 の バラ ンス が 悪い と , 


ハー ド ウェア 割り 込み 鐘 


LT+ ャ … 還 


割り 込み 分 配 器 較 


1 一 4 個 の CPU を 図 
用 いて 対称 マル チ 図 


還 還 画 組み 込み 分 野 の 
記 還 時 [マル チコ ア 」 


特定 の タス ク ま た は スレ ッ ド が ボ ト ルネ ッ ク と な っ て 負荷 


が 適正 に 分 散 し ませ ん . この た め , 各 タ スク や スレ ッ ド の 
opt 
ます . 


それ ぞ れ の タス ク や スレ ッ ド の 性 能 は , 厳密 に は ハー ド 
ウェ ア に 実装 し た と き に 初め て 決ま り ま す . この た め , 机 
上 で シス テム 性 能 を 見 積もる た め の ハ ー ド ウェ ア の エミ ュ 
レー ショ ン 環 境 や , 実 ハ ー ド ウェ ア の 性 能 を 正確 に 計測 す 
る ツー ル が 必要 に な り ま す . この よう な ツー ル は , 図 7 の 
例 の よう に いく つか 出 始め て いま す が , まだ まだ 普及 に は 
いた っ て いま せん . 


人 @ 広く 普及 する た め に は デバ ッ グ 環境 の 整備 が 必須 
タス ク や スレ ッ ド を 実行 する プロ セッ サ が シス テム の 稼 
働 中 に 決定 され る よう な 方 式 を 動 的 負荷 分 散 と 言い ます . 
この よう な シス テム で は , 特定 の プロ セッ サ 動 作 時 に 
昌 昌 Eo ウロ 
また , 一 つの プロ セッ サ で 不 ぐ あい が 発生 する と , ほか 
の プロ セッ サ の 動作 に よっ て は , 不 ぐ あい を 起こ し た 環境 
が 破壊 され て し まい , 不 ぐ あい の 再現 や 解析 に 支障 を きた 
すこ と が あり ます . 


プラ イベ ー ト 割り 込み 図 


プロ セッ サ を 構成 図 IRQ IRQ IRQ IRQ 


CPU/VFP CPU/VFP CPU/VFP CPU/VFP 


1 次 キャ ッシュ ・ メ モリ 還 


命令 / デ ー タ ・ 図 コヒーレンス 加 


1 次 キャ ッシュ ・ メ モリ 還 


二重化 [1 タグ 図 


1 次 キャ ッシュ ・ メ モリ 園 1 次 キャ ッシュ ・ メ モリ 団 


スヌープ 制御 ユニ ッ ト ( SCU) 図 


バズ 64 ビ ッ ト ) 図 制御 バス 図 


AXI バ スズ (オプション) 較 
( 読み 出し / 書 き 込 み 用 64 ビ ッ ト ・ バ ス ) 図 


VFP: vector floating point 
( 浮動 小数 点 ユ ニッ ト ) 較 


図 5 マル チ プ ロ セ ッ サ の 例 その 2) 
ARM 社 の マル チ プ ロ セ ッ サ ・ コ ア 「 ARM11 MPCore」 の 内 部 ブロ ッ ク 図 . ホモ ジニ アス で 対称 マル チ プ ロ セ ッ サ の 処理 に 対応 し て いる . 


AXI バ ス MM 込み 用 
64 ビ ピット ・ バ ス 図 
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単 一 制御 フロ ー を 複数 スレ ッ ド に 分 割 実行 
の e 命令 に よる スレ ッ ド 制御 図 


e Fork 時 レジ スタ 継承 較 


D2 D3 . 基 陸 、 


ヽ Thcomt の 
Thconrt 人 に 還 還 間 ga 


Thcomt: スレ ッ ド 処理 較 


Thabort: スレ ッ ド 処理 図 


『 Ia 廃棄 図 ャ 
図 6 2 周 目 ーーー 
自動 並列 化 に よる 投機 並列 実行 
動 並 贅 化 に より , さら な る 性 能 効 
率 の 改善 , 開発 の 効率 化 を 行う . こ 
の 方 法 の メリ ッ ト は , 並列 動作 が 可 ( a) プロ グラ ム 較 ( b) 通常 の プロ セッ サ 図 ( c) 投機 マル チ ス レッ ディ ング 罰 
能 な 命令 の 発行 ウィ ンド ウ を 不 連続 記述 構造 凶 で の 実行 順序 較 ( 制御 並列 ) 図 


に 広げ られ る こと . ( 制御 フロ ー・ グ ラフ ) ( 単 一 制御 フロ ー) 


、 PC+000134 MM 
の むね USer fiq svc | Global Variabl 
ia01000 // 0x0000012c : 00000086 昌一 mpthneedLmsin...| Uxa000f4 
e3300000 Ox00000130 = 0O1100ac 3: 
= 00000192 0x0000000 
2822003 // 0x00000198 。 4DD - 00000010 E 
= 0011019c 
0P = 00000001 
afffff9 // 0z00000148 = 0O111308 -.。 0x0000000 
3s00000 // 0:00000180 MOV = 000001a4 000014 
5912000 // 0x00000184 = 00000000 00000000 000001 
e282200 0x00000188 RIl = 00000000 00000000 Ox0000008 
[ = 00000000 00000000 0x000000 
e2800001 // 0x00000190 = 00000000 00000000 x000 
=A12Zr24 Oo0noonn 


bafffff9 Rm 開 KM 
3a00000 // 0x0000019c 3 プロ セッ サ 凶 

名 | cePEuss Dame: SimCamt = 6275 Messimcot ラン 627】 使用 率 
2d4ffe 7/ 0x000068d4 | 重 Th0。 本 Tht。 本 Th2 本 Th3, 昌 :T4。 昌 :T5/ 本 Th6。 


lela00000 // 0x000003e0 
le3e00063 科 6144 5632 5120 4608 
le59f01c4 // 0x000003f0 
】 衣 呈 // 0x00000558 3584 
le91c600f // 0x0000055c 
クロ ス ・ ト リガ に よる 工 
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図 7 マル チ プ ロ セ ッ サ の デバ ッ グ 環境 

プロ セッ サ の 使用 効率 の モニ タリ ング や プロ セッ サ 間 の クロ ス ・ ト リガ 機能 に よ 
っ て , 性 能 の 最適 化 や 効率 の 良い デバ ッ グ を 行う 必要 が ある . 一 例 と し て , 筆者 
ら が マル チ プ ロ セ ッ サ の 開発 に 使用 し て いる ツー ル の イメ ー ジ を 示す . 


この よう な ケー ス を 防ぐ た め , プロ セッ サ に よっ て は 
個々 の プロ セッ サ の 動作 状態 を ほか の プロ セッ サ に 通知 す 
る し くみ を 持っ た も の が あり ます . この よう な し くみ を 用 
いた デバ ッ グ 手 法 や ツー ル の 確立 が 必要 と な り ま す . 

上 述 し た 課題 を 解決 する に は , マル チ プ ロ セ ッ サ を 使っ 
て いく うえ で 必要 と な る ソフ ト ウェ ア や 開発 環境 の 基盤 を 
整備 し な けれ ば な り ま せん . ひと た び 基 盤 が 整え ば , 組み 
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込み 機器 の 分 野 で も マル チ プ ロ セ ッ サ を 使い こなし て いく 
こと は 上 難し いこ と で は あり ませ ん . 

マル チ プ ロ セ ッ サ を 使う こと に よっ て , 組み 込み 機器 で 
は これ まで 考え られ な か っ た よう な 高 性 能 , 高 機能 機器 が 
実現 され て いく も の と 考え て いま す . 
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